Model Selection

Frozen Pretrained Models

# Frozen Pretrained Models

Image Captioning

BLIP-2 is a vision-language model that combines an image encoder with a large language model for image-to-text generation tasks.

Transformers English

Blip2 Opt 2.7b Coco

BLIP-2 is a vision-language pretrained model that guides language-image pretraining by freezing the image encoder and large language model.

Transformers English

BLIP-2 is a vision-language model that combines an image encoder with a large language model for image-to-text generation tasks.

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase